查看原文
其他

如何减少运维采坑,系统交维文档是第一关

雷水平 半山里人 2024-05-31


在运营商大数据领域,大数据系统工程项目呈现主机设备多、网络策略复杂、数据量大、产品多等特点,厂商项目组在实施完工程后,如果交维工作没做到位,将给大数据系统管理部门及本地PSO的运维工作留下很多坑,运维的难度和系统故障风险将急剧增加。会出现这样的案例,系统出现故障,本地PSO查阅交维文档,发现系统信息不全,找研发却找不到人(产品研发项目组已解散),只能PSO摸索,导致故障处理延误,业务无法及时恢复,引来投诉。因此,交维工作质量的好坏,是做好大数据系统运维的第一关。那么如何做好交维工作,先从运维文档开始。

最近在管理一个工程项目,陆陆续续开始有一些交维工作,为了不给后续运维留下坑,交维文档质量是关键,下面列出了交维过程需要包含哪些文档,笔者只是站在工程管理角度来写,可能不够全面,望有人能够补充提醒:

一、主机层面

1、主机信息清单

主机信息清单就是系统部署在哪些主机上的信息,这是最基本的,没有该清单,根本就不知道应用服务部署在哪,发生系统故障都不知道去哪排查。主机信息清单要包含这些信息:主机所在机房、机架信息、主机归属单位,主机IP、主机名、主机负责人(包含姓名、所在单位、主机负责人联系号码、邮箱)、用途、主机账号(包括root账号和密码、主机用户账号和密码)等

2、主机配置基本信息

要包含主机品牌系列、CPU、内存、存储、类型等信息

3、主机资源分配清单

二、网络层面

1、生产系统网络策略清单

涉及范围有本系统与外部系统的网络策略、内部系统之间的网络策略,信息包括:策略申请的系统、策略单号、策略申请接口人、源IP地址、源IP地址端口、源地址负责人、目的IP地址、目的IP的端口、目的地址负责人、策略生失效时间、传输协议、用途等。

2、测试系统网络策略清单

三、数据库层面

1、数据库服务清单

产品使用的全部数据库信息,如mysql、redis、hive、gbase等,包括数据库ip地址、端口号、数据库登入root账号、用户账号、密码等

2、数据库部署清单

3、数据库字典、数据库部署脚本

四、应用层面

1、软件安装包、软件安装脚本

2、产品安装部署指导手册

3、系统用户账号清单

包括超级管理员账号、用户账号等

4、系统接口规范

5、应用设计文档

应包含系统总体架构、系统边界、功能详细设计内容

6、服务监控部署清单

7、系统压力测试报告

8、产品用户手册

9、运维常见问题处理手册

由于笔者经验有限,在短暂的时间内无法将软件交维各方面的内容讲清楚、讲全面,产品需要不断快速迭代,才能成为优秀产品,好的文章也像产品需要不断的迭代才能突显价值,后续结合笔者经验积累,不断更新本文。也希望大家能够提供软件交维过程的宝贵经验,来完善本文。


半山里人:liyinxuan0

长按二维码,关注此号

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存